1. Introdução
2. Definição do grupo de dados
3. Definição do método de agrupamento e critério de dissimilaridade 4. Definição da quantidade de Grupos
5. Conclusão
## Warning in function_list[[k]](value): NAs introduzidos por coerção
## Warning in function_list[[k]](value): NAs introduzidos por coerção
## Warning in function_list[[k]](value): NAs introduzidos por coerção
Felipe ja escreveu
Buscando selecionar um grupo de cartas com estruturas semelhantes e variáveis numéricas para que possamos realizar a análise de agrupamentos, utilizaremos neste estudo somente as cartas do tipo “Criatura”. Cada uma delas representa um personagem no universo do jogo e possuem as características abaixo:
| Variável | Descrição |
|---|---|
| Power | Força de Ataque |
| Toughness | Força de Defesa |
| Mana Cost | Custo de Utilização |
O objetivo do agrupamento será classificar as cartas em categorias onde as criaturas se assemelhem em suas aplicações estratégias do jogo. A quantidade e definição dos grupos não está pré definida.
De um total de 8370 criaturas disponíveis na base de dados, foi relizado um tratamento para que houvesse somente um elemento com cada combinação única das três variáveis. Após o tratamento, o arquivo utilizado para o estudo tinha disponível 380 elementos., uma quantidade grande o suficiente para prosseguirmos com as análises.
Visualização das observações:
MAtriz de Correlação:
Podemos observar também que existe uma correlação média entre as variáveis. Segundo Hair (pg 446), a medida de distancia de Mahalanobis é mais adequada quando as variáveis são altamente correlacionadas, seguiremos, portanto, utilizando a medida de distância Euclidiana.
Neste estudo, a similaridade entre as observações será medida de acordo com a distância euclidiana em cada par de observações, com base nas variáveis Power, Tougness e Cost, no espaço tridimencional, onde as distancias menores vão representar maior similaridade.
Como não está pré-definida a quantidade de grupos, realizaremos uma comparação entre métodos hierárquicos Ward, UPGMA, WPGMA, WPGMC, e UPGMC.
A visualização hierárquica dos métodos pode ser visualizada na figura abaixo
Observando a curvatura do gráfico de cotovelo e a distribuição observações na hierarquia dos diferentes métodos, vamos criar 5 clusters utilizando o método de Ward.
## grupos.ward
## 1 2 3 4 5
## 92 68 123 49 15
Visualização dos Grupos no espaço tridimensional:
Visualizando as características de cada grupo individualmente:
Observando as características dos grupos, podemos descreve-los